检索结果

Select

1. 基于主动学习先验的半监督 K-means聚类算法

柴变芳, 吕峰, 李文斌, 王垚

计算机应用 2018, 38 (11): 3139-3143. DOI: 10.11772/j.issn.1001-9081.2018041251

摘要（734）

PDF （827KB）（402）

基于迭代框架的主动半监督聚类框架（IASSCF）是一个流行的半监督聚类框架。该框架存在两个问题：其一，初始先验信息较少导致迭代初期聚类效果不佳，进而影响后续聚类结果；其二，每次迭代只选择信息量最大的一个样本标记，导致运行速度慢、性能提升慢。针对这两个问题，设计了一种基于主动学习先验的半监督K-means聚类算法。该方法包含初始化阶段和迭代阶段。初始化阶段主动选择代表性较高的节点集合，并基于代表节点集合构建各类的先验节点集合和约束先验集合。迭代阶段，每次迭代包含三步：1）基于当前约束先验集合，利用约束半监督聚类算法PC K-means对数据进行聚类；2）依据当前聚类结果，主动选择每个簇中最具价值信息的未标注样本点；3）利用选择样本点扩充先验节点集合及约束集合。迭代此过程至达到收敛阈值。实验结果表明，与基于原IASSCF框架的半监督K-means聚类算法相比，所提算法运行速度更快，性能更优。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于链接模型的主动半监督社区发现方法

柴变芳, 王建岭, 许冀伟, 李文斌

计算机应用 2017, 37 (11): 3090-3094. DOI: 10.11772/j.issn.1001-9081.2017.11.3090

摘要（477）

PDF （756KB）（506）

链接模型可对网络的社区发现问题建模，相比具有相同目标的对称模型和条件模型，PPL模型处理网络类型更多、社区发现准确率更高。但PPL模型是一个无监督模型，在网络社区结构不清晰时效果不佳，且不能利用易获取的先验信息。为使用尽可能少的先验，获得社区发现链接模型性能较大的提升，提出了一个主动节点先验学习（ANPL）算法，该算法主动选择效用高、易标记的成对约束进行标记，基于标记的约束对自动生成信息量更大的标记节点集合。基于PPL模型设计了一个融合网络拓扑结构和标记节点先验的半监督社区发现（SPPL）模型，并给出模型用于半监督社区发现的参数估计算法。人工网络和实际网络上的实验结果表明，利用ANPL获得的标记节点先验和网络拓扑结构，SPPL模型的社区发现准确率高于无监督PPL模型及当前流行的基于非负矩阵分解（NMF）的半监督社区发现模型。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于迭代框架的主动链接选择半监督社区发现算法

陈嶷瑛, 柴变芳, 李文斌, 贺毅朝, 吴聪聪

计算机应用 2017, 37 (11): 3085-3089. DOI: 10.11772/j.issn.1001-9081.2017.11.3085

摘要（513）

PDF （758KB）（518）

针对非负矩阵分解（NMF）半监督社区发现方法随机选择先验约束，导致提升相同性能需要更多约束信息的问题，提出一种基于迭代框架的主动链接选择半监督社区发现算法——ALS_GNMF。在迭代框架下，首先，主动选择不确定性高且对社区划分指导性强的链接对作为先验信息；其次，为主动选择的链接对增加must-link约束，增强社区间连接，生成先验矩阵；同时，增加cannot-link约束，减弱社区间连接，修改邻接矩阵；最后，将先验矩阵作为正则项，加入基于NMF的最优化目标函数，并融合网络拓扑结构信息，以期用较少的先验信息，达到较高的社区发现准确性和鲁棒性。实验结果表明，ALS_GNMF算法在真实网络及人工网络上，相同的先验比例下，性能比未采用迭代框架和主动策略的NMF半监督社区发现方法有更大的提升，且在结构不清晰的网络中表现稳定。

参考文献 | 相关文章 | 多维度评价